期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 融合篇章表征的事件指代消解研究
吴瑞萦, 孔芳
北京大学学报自然科学版    2020, 56 (1): 82-88.   DOI: 10.13209/j.0479-8023.2019.091
摘要1012)   HTML    PDF(pc) (711KB)(122)    收藏
事件指代消解任务比实体指代消解难度大, 主要原因为事件描述在非结构化文本中分布稀疏, 且不具备同指关系的单链占很大比例, 同时事件自身承载的语义信息比实体更加丰富。为了准确地抽取文本中的同指事件, 针对以上特点, 提出一种融合篇章表征的事件指代消解模型。该模型通过CRF有效地区分非事件句、单链以及同指链, 同时利用分层注意力机制捕捉句子级别和篇章级别的重要信息。在KBP2015和2016数据集上进行的事件指代消解实验验证了该模型的有效性, 在CoNLL评测标准下F1值达到43.07%。
相关文章 | 多维度评价 | 评论0
2. 中文篇章零元素语料库构建
盛晨, 孔芳, 周国栋
北京大学学报自然科学版    2019, 55 (1): 15-21.   DOI: 10.13209/j.0479-8023.2018.057
摘要828)   HTML    PDF(pc) (672KB)(267)    收藏

针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作。首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性。然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC语料库的构建。最后, 对该语料库进行一系列详细的统计分析。结果表明, CDZC能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持。

相关文章 | 多维度评价 | 评论0
3. 基于中英文可比较语料的中文零指代消解
杨紫怡, 贡正仙, 孔芳, 周国栋
北京大学学报自然科学版    2017, 53 (2): 279-286.   DOI: 10.13209/j.0479-8023.2017.038
摘要1003)   HTML20)    PDF(pc) (350KB)(295)    收藏

针对中文篇章中的零指代问题, 提出一种基于中英文可比较语料进行中文零指代识别和消解的方法, 并提出英文对等句的概念。利用对等句, 重新定义句子间隔, 并引入双语词对齐特征。在基准平台基础上, 从零指代项识别和零指代项消解两个方面进行研究。在 OntoNotes5.0 语料上的实验结果表明, 与目前性能最好的系统相比, 新提出的基于中英对等语料的中文零指代方法取得更好的性能。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0